Các loại thực thể có tên Nhận dạng thực thể có tên

Trong thuật ngữ thực thể có tên, từ có tên giới hạn nhiệm vụ trong những thực thể mà một hoặc nhiều rigid designators, theo định nghĩa của Kripke, tham chiếu đến. Ví dụ, công ty ô tô sáng lập bởi Henry Ford năm 1903 được đề cập là Ford hoặc công ty ô tô Ford. Rigid designators bao gồm cả tên riêng và các khái niệm tự nhiên nhất định như các loài sinh học hoặc các chất.

Các ngữ biểu thị thời gian và số (tiền tệ, phần trăm, v.v.) được thống nhất đưa vào trong ngữ cảnh của nhiệm vụ NER. Trong khi một số trường hợp của các loại trên là ví dụ tốt cho rigid designator (ví dụ: năm 2011), có rất nhiều các trường hợp không hợp lệ (ví dụ: Tôi đi nghỉ vào tháng Sáu). Trong trường hợp đầu, năm 2001 đề cập đến năm thứ 2001 của Dương lịch. Trong trường hợp sau, tháng Sáu có thể nói đến tháng của một năm không xác định (tháng Sáu năm ngoái, tháng 6 năm tới, tháng Sáu nắm 2020, v.v.). Định nghĩa thực thể có tên có được nới lỏng trong các trường hợp trên để phù hợp với thực tiễn hay không là vấn đề tranh cãi. Do đó định nghĩa của thuật ngữ thực thể có tên không chặt chẽ và thường được cắt nghĩa lại trong ngữ cảnh nó được sử dụng.[4].

Có ít nhất là hai phân cấp phân loại thực thể có tên đã được đề xuất trong các tài liệu. Phân loại BBN, đề xuất năm 2002, được sử dụng cho bài toán trả lời câu hỏi và bao gồm 29 kiểu, 64 kiểu con.[5] Phân cấp mở rộng của Sekine, đề xuất năm 2001, tạo bởi 200 kiểu con.[6]